Les pesticides prennent une place importante dans les productions agricoles en France pour faire face à une concurrence internationale et aux espèces parasites envahissantes qui réduisent les rendements des productions agricoles. Face au constat de ce problème, plusieurs substances s’imposent dont celle faisant partie de notre étude : “le Glyphosate”. Dans notre travail, nous porterons notre analyse sur cette substance au travers de la problématique suivante :
Quels sont les déterminants de la quantité de Glyphosate achetée dans les départements français ? Nous analyserons dans notre travail l’impact des types de culture dans le département (céréales, vignes), sa surface agricole utilisée et sa production brute standard sur la quantité de glyphosate achetée.
Autrement dit, par l’analyse de la quantité de glyphosate achetée par département et de la culture dominante, la production brute standard et la surface agricole utilisée par département, nous chercherons à expliquer si une culture a un impact significatif sur la quantité de glyphosate achetée et chercherons si cette relation est davantage significative en fonction de la PBS ou de la SAU.
Dans notre étude, nous mobiliserons deux sources principales de données. D’une part, les données issues du recensement agricole de 2020 (dernières données en date), qui fournissent des informations structurelles sur les caractéristiques agricoles des départements (types de cultures, surfaces agricoles, production brute standard). D’autre part, les données des quantité acheté de glyphosate de 2022.
Bien que ces deux jeux de données proviennent de périodes différentes, leur agrégation est économiquement justifiée par la relative stabilité des structures agricoles sur une courte période de deux ans. En effet, les évolutions de l’organisation agricole à l’échelle départementale restent généralement limitées à court terme, rendant les variables de 2020 représentatives de la situation contemporaine en 2022. Toutefois, nous reconnaissons qu’une légère évolution, notamment liée aux politiques environnementales récentes, pourrait avoir affecté certaines pratiques. Cette limite sera prise en compte dans l’interprétation des résultats.
substance (https://www.data.gouv.fr/fr/datasets/achats-de-pesticides-par-code-postal/)
vignes (https://agreste.agriculture.gouv.fr/agreste-web/disaron/Carte-RA-partvigne20/detail/)
pbs (https://agreste.agriculture.gouv.fr/agreste-web/disaron/Carte-RA-pbs20/detail/)
sau (https://agreste.agriculture.gouv.fr/agreste-web/disaron/Carte-RA-sau20/detail/)
cereales (https://agreste.agriculture.gouv.fr/agreste-web/disaron/Carte-RA-partcereoleopro20/detail/)
Nous fusionnons les bases de données pour obtenir une seule et même base contenant les informations utiles. Ces bases sont réunies par la variable en commun “code_departement”. Les informations manquantes représentées par le symbole N/A seront comptabilisées comme une valeur nulle c’est-à-dire “0”. Dans un premier temps nous avions retiré ces valeurs, mais nous perdions trop d’information et cela faussait l’analyse et les modèles. Nous avons fait le choix de remplacer les N/A par “0” de manière à garder la donnée des autres variables pour les départements ayant N/A comme information et ne pas omettre totalement la ligne sous prétexte que qu’une donnée est manquante. Pour être encore plus précis nous pourrions dans un second temps envisager de faire la moyenne des départements voisins pour déduire la donnée d’un département. Quelque soit la méthode, une donnée manquante ne peut pas être remplacée, elle peut aux mieux être estimée et approchée le tout est de chercher à l’approcher le plus fiablement et réalistiquement possible et cela requiert une maîtrise du sujet et des données traiter. Par exemple dans notre cas, la culture de vignes est souvent très localisée: les appelation change parfois d’une parcelle à une autre ce qui détermine la prépondérance de la culture viticole à certains endroits et sont absence dans d’autres. Faire la moyenne de trois départements dont deux ayant une appellation prestigieuse (particulièrement pourvu en vigne) et un troisième sans appellation particulière (avec aucune vignes), si la donnée est manquante pour le troisième alors l’estimer en moyenne de ses voisins serait faux. Mais l’estimer par un “0” serait faux aussi. Il s’agit alors de l’estimer en trouvant une méthode adaptée.
Nous travaillons sur 5 bases de données que nous fusionnons pour étudier l’utilisation de substances phytosanitaires par département en fonction des cultures sur des observations de 2022.
code_departement - numéro indicatif pour chaque département
departement - nom du département
somme_dep - quantité de glyphosate achetée dans le département (exprimée en Kg)
cereales - part des céréales et oléagineux dans la SAU (en % de la SAU)
vignes - part de vignes dans la SAU (en % de la SAU)
pbs - production brute standard, production potentielle totale des exploitations par département, résultant des valeurs moyennes des rendements et des prix observés sur la période 2015 à 2019, exprimée en euros.
log_pbs - le logarithme de la variable PBS
sau - superficie agricole utilisée (en hectares), comprenant les céréales, les oléagineux, protéagineux et plantes à fibres, les autres plantes industrielles destinées à la transformation, les cultures fourragères et les surfaces toujours en herbe, les légumes secs et frais, les fraises et les melons, les pommes de terre, les fleurs et plantes ornementales, les vignes, les autres cultures permanentes (vergers, petits fruits, pépinières ligneuses), les jachères, les jardins et vergers familiaux.
log_sau - le logarithme de la variable SAU
Cette première carte permet de se rendre compte de la répartition des
terres agricoles en France. Le Sud-Est, la Corse ainsi que la région
parisienne proche sont plutôt faiblement pourvus de terres agricoles.
Cela s’explique principalement par le relief pour le Sud-Est et la
Corse, ainsi que par la grande zone urbaine de Paris et sa
périphérie.